Aprenentatge d'Occam

En la teoria de l'aprenentatge computacional, l'aprenentatge d'Occam és un model d'aprenentatge algorítmic on l'objectiu de l'alumne és produir una representació sucinta de les dades d'entrenament rebudes. Això està estretament relacionat amb l'aprenentatge probablement aproximadament correcte (PAC), on l'aprenent és avaluat pel seu poder predictiu d'un conjunt de proves.

L'aprenentatge d'Occam implica l'aprenentatge de PAC, i per a una gran varietat de classes de conceptes, també és cert el contrari: l'aprenentatge de PAC implica l'aprenentatge d'Occam.[1]

Occam Learning rep el nom de la navalla d'Occam, que és un principi que estableix que, tenint en compte que totes les altres coses són iguals, s'hauria d'afavorir una explicació més curta de les dades observades en lloc d'una explicació més llarga. La teoria de l'aprenentatge d'Occam és una justificació formal i matemàtica d'aquest principi. Va ser mostrat per primera vegada per Blumer, et al.[2] que l'aprenentatge d'Occam implica l'aprenentatge PAC, que és el model estàndard d'aprenentatge en la teoria de l'aprenentatge computacional. En altres paraules, la parsimònia (de la hipòtesi de sortida) implica poder predictiu.[3]

La concisió d'un concepte a classe de concepte es pot expressar per la longitud de la cadena de bits més curta que pot representar en . L'aprenentatge d'Occam connecta la concisió de la sortida d'un algorisme d'aprenentatge amb el seu poder predictiu sobre dades no vistes.

Deixar i ser classes de conceptes que contenen conceptes i hipòtesis objectiu respectivament. Després, per a constants i , un algorisme d'aprenentatge és un -Algorisme d'Occam per utilitzant si, donat un conjunt de mostres etiquetades segons un concepte , dona sortida a una hipòtesi de tal manera

  • és coherent amb activat (això és, ), i
  • [4][5]

on és la longitud màxima de qualsevol mostra . Un algorisme d'Occam s'anomena eficient si s'executa en un polinomi de temps , , i Diem una classe de conceptes és Occam aprendre respecte a una classe d'hipòtesis si existeix un algorisme Occam eficient per utilitzant

  1. Mavuduru, Amol. «What Occam’s Razor Means in Machine Learning» (en anglès). towardsdatascience.com, 09-08-2022. [Consulta: 15 febrer 2023].
  2. Blumer, A., Ehrenfeucht, A., Haussler, D., & Warmuth, M. K. (1987). Occam's razor. Information processing letters, 24(6), 377-380.
  3. published, Joshua A. Krisch. «What is Occam's razor?» (en anglès). https://www.livescience.com,+19-12-2022.+[Consulta: 15 febrer 2023].
  4. Kearns, M. J., & Vazirani, U. V. (1994). An introduction to computational learning theory, chapter 2. MIT press.
  5. Blumer, A., Ehrenfeucht, A., Haussler, D., & Warmuth, M. K. (1987). Occam's razor. Information processing letters, 24(6), 377-380.

Developed by StudentB